ChatGPT到底学了多少「污言秽语」?清华团队首提大语言模型中文语料污染治理技术 ChatGPT到底学了多少「污言秽语」?清华团队首提大语言模型中文语料污染治理技术 关键词: 模型污染词汇表,模型训练,chatGPT,PoC tokens 如果我们的教科书里包含大量的污言秽语,那么我们能学好语言吗?这种荒唐的问题却出现在最先进 ChatGPT 系列模型的学习过程中。 来自主题: AI技术研报 6138 点击 2025-08-26 12:11